動機
今年八月時接到一個任務,是一間國內工廠的科專計畫,一部分是要分析線上型錄網站使用者的點擊行為,我們藉由機器學習做多元線性回歸分析使用者的停留時間,另一部分是使用FPTree做資料探勘由過去訂單產生推薦商品,在尋找相關資料及實作的過程中對機器學習及資料探勘產生了濃厚的興趣,因此決定繼續往下研究順便把這段時間研究的心得記錄下來,也逼迫自己必須努力學習。
何為資料科學
現代不論電子商務還是一般零售、銀行金融在與顧客互動時都會產生巨量的資料,透過分析這些資料能幫助企業經營更有效率、與消費者關係更緊密、解決企業的難題;簡單說資料科學是一門解決實際問題的學問-如何在雜亂的資料中萃取出有用的資訊;例如銀行的信用卡核發,如何在過往的交易紀錄、財務狀況、信用評等中找出變數與個體間的關聯性,判斷對方是否能償債最後決定要不要發卡。有了資料後如何在資料中找出有用的資訊,常見的方法有三個-統計分析、機器學習及資料探勘;在接下來的系列文章主要會介紹並實作機器學習與資料探勘。
系列文章規劃
1.機器學習介紹與實作
淺談機器學習
常見演算法介紹與比較
Python Tensorflow Anaconda環境建置
實作線性回歸
實作羅吉斯回歸
2.資料探勘介紹與實作
淺談資料探勘
常見演算法介紹與比較
實作Apriori
實作FPTree
參考資料來源:
https://buzzorange.com/techorange/2017/03/15/amazonguide/
https://taweihuang.hpd.io/2016/09/07/%E8%A7%A3%E9%87%8B%E3%80%81%E5%80%8B%E9%AB%94%E9%A0%90%E6%B8%AC%E3%80%81%E8%B6%A8%E5%8B%A2%E9%A0%90%E6%B8%AC%EF%BC%9A%E8%B3%87%E6%96%99%E7%A7%91%E5%AD%B8%E7%9A%84%E4%B8%89%E5%80%8B%E9%9D%A2%E5%90%91/
https://buzzorange.com/techorange/2017/03/23/data-science-money/
後學才疏學淺,如有謬誤還請各位先進不吝指教。